假使某一種疾病由XYZ病毒引起, 該病毒的攜帶者發病率為1000分之1, 現在有化驗方法可以100%檢驗出XYZ病毒, 但是用這種化驗方法的假陽性率為5%, 換句話說, 如果一個人體內有XYZ病毒, 透過這個檢查一定可以被發現, 但是一個健康的未攜帶病毒者接受這種化驗, 有5%的可能性被誤診為XYZ病毒的攜帶者.
現在從人群中隨機選取一人進行檢測, 結果是陽性, 在完全不考慮個人資料與病史的情況下, 這位受檢者真正攜帶XYZ病毒的機率是多少?
大部分人的答案是95%, 但正確的答案是2%. 因為用這個檢驗方法檢驗1000人, 只有一個人真正攜帶病毒, 而且會被正確地檢驗出來. 另外999個健康的人也接受了這個檢查, 但有約50個人會被錯誤地檢查出攜帶病毒. 也就是說...這51個被判定有陽性反應的人當中, 只有1個人真正帶有XYZ病毒, 約為2%.
這是寫在這本書上的例子. 很多時候, 我們對"機率"的估算其實錯得離譜 (2%對上95%). 不是只有這個例子, 華人對於科學方法, 統計, 數據...常常是不太重視的.
我覺得這真的是引導我們了解數據的重要性的一本很有趣的書啊...